TAGTTTGTATTTTTCATTACCAGCAAGGGTAAACAGTTATCCATGACCCATTTCTATGTTCTCGT 
GGCATGCTTCCATGTACTGCCTCTGCATGCAGCAGGCCACCTCGGGCAGAGCCTAAAGCATGTGA 
TAAATGAAATGCTATCACAATACAGGTTGTGTCTGAAAAACAAATGGCAACTTATTATCCAAGAT 
CAATGAAGGAAAAAGCAAATTTACTAAAATATTTCTTTATTTGAATAAGGTCAATGCCATTTCTT 
GAATTCCAGCTAGCATCAAATAATCAGGAAAAAAAAAACTTGACAAAATGTTATCCAATTGAAAT 
TGACAGTGGATAGAAAACCCTTTTAAACTTTAAGTAATGTCATAAAAGAAATATATTAAACAAGC 
AACAGACAGATCTAAAAAGTTCCAAGTGTGGATTTGACATTAGATCTTATAAATTAAAAAAATCC 
TCAATATAATCATTTGTTCACTATCTTCTTTCAATAAGCACATGGACAGGGAAAGATAATCACAC 
CTTAATATTCACAACTGCTATTTGTGTTCTTTACAAAAATTGTATCTCTGCAATGCAGTGAGGCA 
GGCAATCCCTTGTTCAAGTCATTTCTGTTTTCCCTAAGTTATCAAAAAGTACAACTGTCTGATAT 
AAATTGTTACCATAATCACAATCAGGAAGGCAAAGAAGCTTTAGCAGGCAGGCTTGAAGATGGGA 
GTTTTCATGGCTTGACCATGAATGATCTCAAGATGATTTCATAAGATTAAAAGCCATCACGAAAA 
TACTGAAAGCAACAGGTAATAATCTGGATTCAGTCTGTAGTTGCTCATGAACCACGCGTTTTAAT 
AAAAGGAACATTAAGTAAATTGTAGGTATAAAAGAATCAGTGCATATCTGTTAATGTCATTGACA 
ATAAAAATATATTATCTTCTCAGCTCAGCTCTAAATTAACAAAACACCTATTTTTTTTTTCCCAC 
TCCTCATTTTAGTGGTTCTCAAACATTGGTGTGCTCAGAATCTCCTGAGGT 



FIG. 1 



Sequence Range: 1 to 4527 



10 20 30 40 50 60 

TCCTTGGGTTCGGGTGAAAGCGCCTGGGGGTTCGTGGCCATGATCCCCGAGCTGCTGGAG 
AGGAACCCAAGCCCACTTTCGCGGACCCCCAAGCACCGGTACTAGGGGCTCGACGACCTC 

70 80 90 100 110 120 

AACTGAAGGCGGACAGTCTCCTGCGAAACCAGGCAATGGCGGAGCTGGAGTTTGTTCAGA 
TTGACTTCCGCCTGTCAGAGGACGCTTTGGTCCGTTACCGCCTCGACCTCAAACAAGTCT 

MAELEFVQ> 

130 140 150 160 170 180 

TCATCATCATCGTGGTGGTGATGATGGTGATGGTGGTGGTGATCACGTGCCTGCTGAGCC 
AGTAGTAGTAGCACCACCACTACTACCACTACCACCACCACTAGTGCACGGACGACTCGG 
I IIIVVVMMVMVVVITCLLS> 

190 200 210 220 230 240 

ACTACAAGCTGTCTGCACGGTCCTTCATCAGCCGGCACAGCCAGGGGCGGAGGAGAGAAG 
TGATGTTCGACAGACGTGCCAGGAAGTAGTCGGCCGTGTCGGTCCCCGCCTCCTCTCTTC 
HYKLSARSFISRHSQGRRRE> 

250 260 270 280 290 300 

ATGCCCTGTCCTCAGAAGGATGCCTGTGGCCCTCGGAGAGCACAGTGTCAGGCAACGGAA 
TACGGGACAGGAGTCTTCCTACGGACACCGGGAGCCTCTCGTGTCACAGTCCGTTGCCTT 
DALSSEGCLWPSESTVSGNO 

310 320 330 340 350 360 

TCCCAGAGCCGCAGGTCTACGCCCCGCCTCGGCCCACCGACCGCCTGGCCGTGCCGCCCT 
AGGGTCTCGGCGTCCAGATGCGGGGCGGAGCCGGGTGGCTGGCGGACCGGCACGGCGGGA 
I P E P Q VYA P PR P T D R LAV P P> 

370 380 390 400 410 420 

TCGCCCAGCGGGAGCGCTTCCACCGCTTCCAGCCCACCTATCCGTACCTGCAGCACGAGA 
AGCGGGTCGCCCTCGCGAAGGTGGCGAAGGTCGGGTGGATAGGCATGGACGTCGTGCTCT 
FAQRERFHRFQPTYPYLQHE> 

430 440 450 460 470 480 

TCGACCTGCCACCCACCATCTCGCTGTCAGACGGGGAGGAGCCCCCACCCTACCAGGGCC 
AGCTGGACGGTGGGTGGTAGAGCGACAGTCTGCCCCTCCTCGGGGGTGGGATGGTCCCGG 
IDLPPTISLSDGEEPPPYQO 

490 500 510 520 530 540 

CCTGCACCCTCCAGCTTCGGGACCCCGAGCAGCAGCTGGAACTGAACCGGGAGTCGGTGC 
GGACGTGGGAGGTCGAAGCCCTGGGGCTCGTCGTCGACCTTGACTTGGCCCTCAGCCACG 
PCTLQLRDPEQQLELNRESV> 

550 560 570 580 590 600 

GCGCACCCCCAAACAGAACCATCTTCGACAGTGACCTGATGGATAGTGCCAGGCTGGGCG 
CGCGTGGGGGTTTGTCTTGGTAGAAGCTGTCACTGGACTACCTATCACGGTCCGACCCGC 
RAPPNRTI FDSDLMDSARLG> 



610 620 630 640 650 660 



FIG. 2A 



GCCCCTGCCCCCCCAGCAGTAACTCGGGCATCAGCGCCACGTGCTACGGCAGCGGCGGGC 
CGGGG ACGGGGGGGTCGTC ATTG AGCC CGTAGTCGCGGTGC ACG ATGC C GTCGCCGCCCG 
GPC P P S.SNSGI SATCYG SGG> 

670 680 690 700 710 720 

GCATGGAGGGGCCGCCGCCCACCTACAGCGAGGTCATCGGCCACTACCCGGGGTCCTCCT 
CGTACCTCCCCGGCGGCGGGTGGATGTCGCTCCAGTAGCCGGTGATGGGCCCCAGGAGGA 
RMEGPPPTYSEVIGHYFGSS> 

730 740 750 760 770 780 

TCCAGCACCAGCAGAGCAGTGGGCCGCCCTCCTTGCTGGAGGGGACCCGGCTCCACCACA 
AGGTCGTGGTCGTCTCGTCACCCGGCGGGAGGAACGACCTCCCCTGGGCCGAGGTGGTGT 
FQHQQS SGPPSLLEGTRL,HH> 

790 800 810 820 830 840 

CACACATCGCGCCCCTAGAGAGCGCAGCCATCTGGAGCAAAGAGAAGGATAAACAGAAAG 
GTGTGTAGCGCGGGGATCTCTCGCGTCGGTAGACCTCGTTTCTCTTCCTATTTGTCTTTC 
THIAPLESAAIWSKEKDKQK> 

850 860 870 880 890 900 

GACACCCTCTCTAGGGTCCCCAGGGGGGCCGGGCTGGGGCTGCGTAGGTGAAAAGGCAGA 
CTGTGGGAGAGATCCCAGGGGTCCCCCCGGCCCGACCCCGACGCATCCACTTTTCCGTCT 
G H P L *> 

910 920 930 940 950 960 

ACACTCCGCGCTTCTTAGAAGAGGAGTGAGAGGAAGGCGGGGGGCGCAGCAACGCATCGT 
TGTGAGGCGCGAAGAATCTTCTCCTCACTCTCCTTCCGCCCCCCGCGTCGTTGCGTAGCA 

970 980 990 1000 1010 1020 

GTGGCCCTCCCCTCCCACCTCCCTGTGTATAAATATTTACATGTGATGTCTGGTCTGAAT 
CACCGGGAGGGGAGGGTGGAGGGACACATATTTATAAATGTACACTACAGACCAGACTTA 

1030 1040 1050 1060 1070 1080 

GCACAAGCTAAGAGAGCTTGCAAAAAAAAAAAGAAAAAAGAAAAAAAAAAACCACGTTTC 
CGTGTTCGATTCTCTCGAACGTTTTTTTTTTTCTTTTTTCTTTTTTTTTTTGGTGCAAAG 

1090 1100 1110 1120 1130 1140 

TTTGTTGAGCTGTGTCTTGAAGGCAAAAGAAAAAAAATTTCTACAGTAGTCTTTCTTGTT 
AAACAACTCGACACAGAACTTCCGTTTTCTTTTTTTTAAAGATGTCATCAGAAAGAACAA 

1150 1160 1170 1180 1190 1200 

TCTAGTTGAGCTGCGTGCGTGAATGCTTATTTTCTTTTGTTTATGATAATTTCACTTAAC 
AGATCAACTCGACGCACGCACTTACGAATAAAAGAAAACAAATACTATTAAAGTGAATTG 

1210 1220 1230 1240 1250 1260 

TTTAAAGACATATTTGCACAAAACCTTTGTTTAAAGATCTGCAATATTATATATATAAAT 
AAATTTCTGTATAAACGTGTTTTGGAAACAAATTTCTAGACGTTATAATATATATATTTA 

1270 1280 1290 1300 1310 1320 

ATATATAAGATAAGAGAAACTGTATGTGCGAGGGCAGGAGTATTTTTGTATTAGAAGAGG 
TATATATTCTATTCTCTTTGACATACACGCTCCCGTCCTCATAAAAACATAATCTTCTCC 

1330 1340 1350 1360 1370 1380 

CCTATTAAAAAAAAAAGTTGTTTTCTGAACTAGAAGAGGAAAAAAATGGCAATTTTTGAG 



FIG. 2B 



GGATAATTTTTTTTTTCAACAAAAGACTTGATCTTCTCCTTTTTTTACCGTTAAAAACTC 

1390 1400 1410 1420 1430 1440 

TGCCAAGTCAGAAAGTGTGTATTACCTTGTAAAGAAAAAAATTACAAAGCAGGGGTTTAG 
ACGGTTCAGTCTTTCACACATAATGGAACATTTCTTTTTTTAATGTTTCGTCCCCAAATC 

1450 1460 1470 1480 1490 1500 

AGTTATTTATATAAATGTTGAGATTTTGCACTATTTTTTAATATAAATATGTCAGTGCTT 
TCAATAAATATATTTACAACTCTAAAACGTGATAAAAAATTATATTTATACAGTCACGAA 

1510 1520 1530 1540 1550 1560 

GCTTGATGGAAACTTCTCTTGTGTCTGTTGAGACTTTAAGGGAGAAATGTCGGAATTTCA 
CGAACTACCTTTGAAGAGAACACAGACAACTCTGAAATTCCCTCTTTACAGCCTTAAAGT 

1570 1580 1590 1600 1610 1620 

GAGTCGCCTGACGGCAGAGGGTGAGCCCCCGTGGAGTCTGCAGAGAGGCCTTGGCCAGGA 
CTCAGCGGACTGCCGTCTCCCACTCGGGGGCACCTCAGACGTCTCTCCGGAACCGGTCCT 

1630 1640 1650 1660 1670 1680 

GCGGCGGGCTTTCCCGAGGGGCCACTGTCCCTGCAGAGTGGATGCTTCTGCCTAGTGACA 
CGCCGCCCGAAAGGGCTCCCCGGTGACAGGGACGTCTCACCTACGAAGACGGATCACTGT 

1690 1700 1710 1720 1730 1740 

GGTTATCACCACGTTATATATTCCCTACCGAAGGAGACACCTTTTCCCCCCTGACCCAGA 
CCAATAGTGGTGCAATATATAAGGGATGGCTTCCTCTGTGGAAAAGGGGGGACTGGGTCT 

1750 1760 1770 1780 1790 1800 

ACAGCCTTTAAATCACAAGCAAAATAGGAAAGTTAACCACGGAGGCACCGAGTTCCAGGT 
TGTCGGAAATTTAGTGTTCGTTTTATCCTTTCAATTGGTGCCTCCGTGGCTCAAGGTCCA 

1810 1820 1830 1840 1850 1860 

AGTGGTTTTGCCTTTCCCAAAAATGAAAATAAACTGTTACCGAAGGAATTAGTTTTTCCT 
TCACCAAAACGGAAAGGGTTTTTACTTTTATTTGACAATGGCTTCCTTAATCAAAAAGGA 

1870 1880 1890 1900 1910 1920 

CTTCTTTTTTCCAACTGTGAAGGTCCCCGTGGGGTGGAGCATGGTGCCCCTCACAAGCCG 
GAAGAAAAAAGGTTGACACTTCCAGGGGCACCCCACCTCGTACCACGGGGAGTGTTCGGC 

1930 1940 1950 1960 1970 1980 

C AGCGGC TGGTGCCC GGGCTAC C AGGGAC ATGCC AG AGGGCTC G ATG ACTTGTCTCTGC A 
GTCGCCGACCACGGGCCCGATGGTCCCTGTACGGTCTCCCGAGCTACTGAACAGAGACGT 

1990 2000 2010 2020 2030 2040 

GGGCGCTTTGGTGGTTGTTCAGCTGGCTAAAGGTTCACCGGTGAAGGCAGGTGCGGTAAC 
CCCGCGAAACCACCAACAAGTCGACCGATTTCCAAGTGGCCACTTCCGTCCACGCCATTG 

2050 2060 2070 2080 2090 2100 

TGCCGCACTGGACCCTAGGAAGCCCCAGGTATTCGCAATCTGACCTCCTCCTGTCTGTTT 
ACGGCGTGACCTGGGATCCTTCGGGGTCCATAAGCGTTAGACTGGAGGAGGACAGACAAA 



FIG. 2C 



2110 2120 2130 2140 2150 2160 

CCCTTCACGGATCAATTCTCACTTAAGAGGCCAATAAACAACCCAACATGAAAAGGTGAC 
GGGAAGTGCCTAGTTAAGAGTGAATTCTCCGGTTATTTGTTGGGTTGTACTTTTCCACTG 

2170 2180 2190 2200 2210 2220 

AAGCCTGGGTTTCTCCCAGGATAGGTGAAAGGGTTAAAATGAGTAAAGCAGTTGAGCAAA 
TTCGGACCCAAAGAGGGTCCTATCCACTTTCCCAATTTTACTCATTTCGTCAACTCGTTT 

2230 2240 2250 2260 2270 2280 

CACCAACCCGAGCTTCGGGCGCAGAATTCTTCACCTTCTCTTCCCCTTTCCATCTCCTTT 
GTGGTTGGGCTCGAAGCCCGCGTCTTAAGAAGTGGAAGAGAAGGGGAAAGGTAGAGGAAA 

2290 2300 2310 2320 2330 2340 

CCCCGCGGAAACAACGCTTCCCTTCTGGTGTGTCTGTTGATCTGTGTTTTCATTTACATC 
GGGGCGCCTTTGTTGCGAAGGGAAGACCACACAGACAACTAGACACAAAAGTAAATGTAG 

2350 2360 2370 2380 2390 2400 

TCTCTTAGACTCCGCTCTTGTTCTCCAGGTTTTCACCAGATAGATTTGGGGTTGGCGGGA 
AGAGAATCTGAGGCGAGAACAAGAGGTCCAAAAGTGGTCTATCTAAACCCCAACCGCCCT 

2410 2420 2430 2440 2450 2460 

CCTGCTGGTGACGTGCAGGTGAAGGACAGGAAGGGGCATGTGAGCGTAAATAGAGGTGAC 
GGACGACCACTGCACGTCCACTTCCTGTCCTTCCCCGTACACTCGCATTTATCTCCACTG 

2470 2480 2490 2500 2510 2520 

CAGAGGAGAGCATGAGGGGTGGGGCTTTGGGACCCACCGGGGCCAGTGGCTGGAGCTTGA 
GTCTCCTCTCGTACTCCCCACCCCGAAACCCTGGGTGGCCCCGGTCACCGACCTCGAACT 

2530 2540 2550 2560 2570 2580 

CGTCTTTCCTCCCCATGGGGGTGGGAGGGCCCCCAGCTGGAAGAGCAGACTCCCAGCTGC 
GCAGAAAGGAGGGGTACCCCCACCCTCCCGGGGGTCGACCTTCTCGTCTGAGGGTCGACG 

2590 2600 2610 2620 2630 2640 

TACCCCCTCCCTTCCCATGGGAGTGGCTTTCCATTTTGGGCAGAATGCTGACTAGTAGAC 
ATGGGGGAGGGAAGGGTACCCTCACCGAAAGGTAAAACCCGTCTTACGACTGATCATCTG 

2650 2660 2670 2680 2690 2700 

TAACATAAAAGATATAAAAGGCAATAACTATTGTTTGTGAGCAACTTTTTTATAACTTCC 
ATTGTATTTTCTATATTTTCCGTTATTGATAACAAACACTCGTTGAAAAAATATTGAAGG 

2710 2720 2730 2740 2750 2760 

AAAAC AAAAAC CTG AGC AC AGTTTTGAAGTTCTAGCC AC TCGAGC TC ATGC ATGTG AAAC 
TTTTGTTTTTGGACTCGTGTCAAAACTTCAAGATCGGTGAGCTCGAGTACGTACACTTTG 

2770 2780 2790 2800 2810 2820 

GTGTGCTTTACGAAGGTGGCAGCTGACAGACGTGGGCTCTGCATGCCGCCAGCCTAGTAG 
CACACGAAATGCTTCCACCGTCGACTGTCTGCACCCGAGACGTACGGCGGTCGGATCATC 

2830 2840 2850 2860 2870 2880 

AAAGTTCTCGTTCATTGGCAACAGCAGAACCTGCCTCTCCGTGAAGTCGTCAGCCTAAAA 
TTTCAAGAGCAAGTAACCGTTGTCGTCTTGGACGGAGAGGCACTTCAGCAGTCGGATTTT 



FIG. 2D 



2890 2900 2910 2920 2930 2940 

TTTGTTTCTCTCTTGAAGAGGATTCTTTGAAAAGGTCCTGCAGAGAAATCAGTACAGGTT 
AAACAAAGAGAGAACTTCTCCTAAGAAACTTTTCCAGGACGTCTCTTTAGTCATGTCCAA 

2950 2960 2970 2980 2990 3000 

ATCCCG AAAGGTAC AAGG AC GC AC TTGT AAAG ATGATTAAAACGTATC TTTCCTTTATGT 
TAGGGCTTTCCATGTTCCTGCGTGAACATTTCTACTAATTTTGCATAGAAAGGAAATACA 

3010 3020 3030 3040 3050 3060 

GACGCGTCTCTAGTGCCTTACTGAAGAAGCAGTGACACTCCCGTCGCTCGGTGAGGACGT 
CTGCGCAGAGATCACGGAATGACTTCTTCGTCACTGTGAGGGCAGCGAGCCACTCCTGCA 

3070 3080 3090 3100 3110 3120 

TCCCGGACAGTGCCTCACTCACCTGGGACTGGTATCCCCTCCCAGGGTCCACCAAGGGCT 
AGGGCCTGTCACGGAGTGAGTGGACCCTGACCATAGGGGAGGGTCCCAGGTGGTTCCCGA 

3130 3140 3150 3160 3170 3180 

CCTGCTTTTCAGACACCCCATCATCCTCGCGCGTCCTCACCCTGTCTCTACCAGGGAGGT 
GGACGAAAAGTCTGTGGGGTAGTAGGAGCGCGCAGGAGTGGGACAGAGATGGTCCCTCCA 

3190 3200 3210 3220 3230 3240 

GCCTAGCTTGGTGAGGTTACTCCTGCTCCTCCAACCTTTTTTTGCCAAGGTTTGTACACG 
CGGATCGAACCACTCCAATGAGGACGAGGAGGTTGGAAAAAAACGGTTCCAAACATGTGC 

3250 3260 3270 3280 3290 3300 

AC TC C C ATCTAGGCTG AAAACCTAGAAGTGG ACCTTGTGTGTGTGC ATGGTGTC AGCCC A 
TGAGGGTAGATCCGACTTTTGGATCTTCACCTGGAACACACACACGTACCACAGTCGGGT 

3310 3320 3330 3340 3350 3360 

AAGCCAGGCTGAGACAGTCCTCATATCCTCTTGAGCCAAACTGTTTGGGTCTCGTTGCTT 
TTCGGTCCGACTCTGTCAGGAGTATAGGAGAACTCGGTTTGACAAACCCAGAGCAACGAA 

3370 3380 3390 3400 3410 3420 

CATGGTATGGTCTGGATTTGTGGGAATGGCTTTGCGTGAGAAAGGGGAGGAGAGTGGTTG 
GTACCATACCAGACCTAAACACCCTTACCGAAACGCACTCTTTCCCCTCCTCTCACCAAC 

3430 3440 3450 3460 3470 3480 

CTGCCCTCAGCCGGCTTGAGGACAGAGCCTGTCCCTCTCATGACAACTCAGTGTTGAAGC 
GACGGGAGTCGGCCGAACTCCTGTCTCGGACAGGGAGAGTACTGTTGAGTCACAACTTCG 

3490 3500 3510 3520 3530 3540 

CCAGTGTCCTCAGCTTCATGTCCAGTGGATGGCAGAAGTTCATGGGGTAGTGGCCTCTCA 
GGTCACAGGAGTCGAAGTACAGGTCACCTACCGTCTTCAAGTACCCCATCACCGGAGAGT 

3550 3560 3570 3580 3590 3600 

AAGGCTGGGCGCATCCCAAGACAGCCAGCAGGTTGTCTCTGGAAACGACCAGAGTTAAGC 
TTCCGACCCGCGTAGGGTTCTGTCGGTCGTCCAACAGAGACCTTTGCTGGTCTCAATTCG 

3610 3620 3630 3640 3650 3660 

TCTCGGCTTCTCTGCTGAGGGTGCACCCTTTCCTCTAGATGGTAGTTGTCACGTTATCTT 
AGAGCCGAAGAGACGACTCCCACGTGGGAAAGGAGATCTACCATCAACAGTGCAATAGAA 
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3670 3680 3690 3700 3710 3720 

TGAAAACTCTTGGACTGCTCCTGAGGAGGCCCTCTTTTCCAGTAGGAAGTTAGATGGGGG 
ACTTTTGAGAACCTGACGAGGACTCCTCCGGGAGAAAAGGTCATCCTTCAATCTACCCCC 

3730 3740 3750 3760 3770 3780 

TTCTCAGAAGTGGCTGATTGGAAGGGGACAAGCTTCGTTTCAGGGGTCTGCCGTTCCATC 
AAGAGTCTTCACCGACTAACCTTCCCCTGTTCGAAGCAAAGTCCCCAGACGGCAAGGTAG 

3790 3800 3810 3820 3830 3840 

CTGGTTCAGAGAAGGCCGAGCGTGGCTTTCTCTAGCCTTGTCACTGTCTCCCTGCCTGTC 
GACCAAGTCTCTTCCGGCTCGCAGCGAAAGAGATCGGAACAGTGACAGAGGGACGGACAG 

3850 3860 3870 3880 3890 3900 

AATCACCACCTTTCCYCCAGAGGAGGAAAATTATCTCCCCTGCAAAGCCCGGTTCTACAC 
TTAGTGGTGGAAAGGRGGTCTCCTCCTTTTAATAGAGGGGACGTTTCGGGCCAAGATGTG 

3910 3920 3930 3940 3950 3960 

AGATTTCACAAATTGTGCTAAGAACCGTCCGTGTTCTCAGAAAGCCCAGTGTTTTTGCAA 
TCTAAAGTGTTTAACACGATTCTTGGCAGGCACAAGAGTCTTTCGGGTCACAAAAACGTT 

3970 3980 3990 4000 4010 4020 

AGAATGAAAAGGGACCCCATATGTAGCAAAAATCAGGGCTGGGGGAGAGCCGGGTTCATT 
TCTTACTTTTCCCTGGGGTATACATCGTTTTTAGTCCCGACCCCCTCTCGGCCCAAGTAA 

4030 4040 4050 4060 4070 4080 

CCCTGTCCTCATTGGTCGTCCCTATGAATTGTACGTTTCAGAGAAATTTTTTTTCCTATG 
GGGACAGGAGTAACCAGCAGGGATACTTAACATGCAAAGTCTCTTTAAAAAAAAGGATAC 

4090 4100 4110 4120 4130 4140 

TGCAACACGAAGCTTCCAGAACCATAAAATATCCCGTCGATAAGGAAAGAAAATGTCGTT 
ACGTTGTGCTTCGAAGGTCTTGGTATTTTATAGGGCAGCTATTCCTTTCTTTTACAGCAA 

4150 4160 4170 4180 4190 4200 

GTTGTTGTTTTTCTGGAAACTGCTTGAAATCTTGCTGTACTATAGAGCTCAGAAGGACAC 
CAACAACAAAAAGACCTTTGACGAACTTTAGAACGACATGATATCTCGAGTCTTCCTGTG 

4210 4220 4230 4240 4250 4260 

AGCCCGTCCTCCCCTGCCTGCCTGATTCCATGGCTGTTGTGCTGATTCCAATGCTTTCAC 
TCGGGCAGGAGGGGACGGACGGACTAAGGTACCGACAACACGACTAAGGTTACGAAAGTG 

4270 4280 4290 4300 4310 4320 

GTTGGTTCCTGGCGTGGGAACTGCTCTCCTTTGCAGCCCCATTTCCCAAGCTCTGTTCAA 
CAACCAAGGACCGCACCCTTGACGAGAGGAAACGTCGGGGTAAAGGGTTCGAGACAAGTT 

4330 4340 4350 4360 4370 4380 

GTTAAACTTATGTAAGCTTTCCGTGGCATGCGGGGCGCGCACCCACGTCCCCGCTGCGTA 
CAATTTGAATACATTCGAAAGGCACCGTACGCCCCGCGCGTGGGTGCAGGGGCGACGCAT 

4390 4400 4410 4420 4430 4440 

AGACTCTGTATTTGGATGCCAATCCACAGGCCTGAAGAAACTGCTTGTTGTGTATCAGTA 
TCTGAGACATAAACCTACGGTTAGGTGTCCGGACTTCTTTGACGAACAACACATAGTCAT 
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4450 4460 4470 4480 4490 4500 

ATCATTAGTGGCAATGATGACATTCTGAAAAGCTGCAATACTTATACAATAAATTTTACA 
TAGTAATC ACCGTTACTACTGT AAG AC TTTTC G ACGTTATGAATATGTTATTT AAAATGT 

4510 4520 
ATTCTTTGGAAAAAAAAAAAAAAAAAA 
TAAGAAACCTTTTTTTTTTTTTTTTTT 



FIG. 2G 



Sequence Range: 1 to 2213 



10 20 30 40 50 60 

GGGGGGCTGACAACAACTGTGATAGGTACGAGGCTGGGTGTGGATCGGCCGAGGCTCTCC 
CCCCCCGACTGTTGTTGACACTATCCATGCTCCGACCCACACCTAGCCGGCTCCGAGAGG 
GGLTTTVIGTRLGVDRPRLS> 

70 80 90 100 110 120 

TGGAGCGCTGGGCCTTCGCTGGCCGCACCGGCAGCCATGAGCTCGGAGATGGAGCCGCTG 
ACCTCGCGACCCGGAAGCGACCGGCGTGGCCGTCGGTACTCGAGCCTCTACCTCGGCGAC 
WSAGPSLAAPAAMSSEMEP L> 

130 140 150 160 170 180 

CTCCTGGCCTGGAGCTATTTTAGGCGCAGGAAGTTCCAGCTCTGCGCCGATCTATGCACG 
GAGGACCGGACCTCGATAAAATCCGCGTCCTTCAAGGTCGAGACGCGGCTAGATACGTGC 
LLAWSYFRRRKFQLCADLCT> 

190 200 210 220 230 , 240 

CAGATGCTGGAGAAGTCCCCTTATGACCAGGCAGCTTGGATCTTAAAAGCAAGAGCGCTA 
GTCTACGACCTCTTCAGGGGAATACTGGTCCGTCGAACCTAGAATTTTCGTTCTCGCGAT 
QMLEKSPYDQAAWILKARAL> 

250 260 270 280 290 300 

ACAGAAATGGTATACATAGATGAAATTGATGTAGATCAGGAAGGAATTGCAGAAATGATG 
TGTCTTTACCATATGTATCTACTTTAACTACATCTAGTCCTTCCTTAACGTCTTTACTAC 
TEMVYIDEIDVDQEGIAEMM> 

310 320 330 340 350 360 

CTGGATGAAAATGCTATAGCTCAAGTTCCACGCCCTGGAACGTCTTTGAAACTCCCTGGA 
GACCTACTTTTACGATATCGAGTTCAAGGTGCGGGACCTTGCAGAAACTTTGAGGGACCT 
LDENAIAQVPRPGTSLKLPG> 

370 380 390 400 410 420 

ACTAATCAGACAGGAGGGCCTAGCCAGGCCGTTAGGCCAATCACACAAGCTGGAAGACCC 
TGATTAGTCTGTCCTCCCGGATCGGTCCGGCAATCCGGTTAGTGTGTTCGACCTTCTGGG 
TNQTGGPSQAVRPITQAGRP> 

430 440 450 460 470 480 

ATTACAGGTTTCCTCAGGCCCAGCACGCAGAGTGGAAGGCCAGGCACTATGGAACAGGCT 
TAATGTCCAAAGGAGTCCGGGTCGTGCGTCTCACCTTCCGGTCCGTGATACCTTGTCCGA 
ITGFLRPST. QSGRPGTMEQA> 

490 500 510 520 530 540 

ATCAGAACACCCAGAACCGCCTACACAGCCCGCCCTATCACCAGCTCCTCCGGAAGATTT 
TAGTCTTGTGGGTCTTGGCGGATGTGTCGGGCGGGATAGTGGTCGAGGAGGCCTTCTAAA 
IRTPRTAYTARPITSSSGRF> 

550 560 570 580 590 600 

GTCAGGCTGGGAACGGCTTCCATGCTTACAAGTCCTGATGGACCATTTATAAATTTATCT 
C AGTC C G ACCCTTGC CG AAGGTAC G AATGTTC AGG ACTACC TGGT AAAT ATTTAAATAG A 
VRLGTASMLTSPDGPFINLS> 

610 620 630 640 650 660 



FIG. 3A 



aggctgaatttaacaaagtattcccagaaacctaagttggcaaaggcttgtttgagtata 
tccgacttaaattgtttcataagggtctttggattcaaccgtttccgaacaaactcatat 
rl"nltkysqkpklakaclsi> 

670 680 690 700 710 720 

TCTTTC ATC ATG AAAATG ATGTT AAG ACTGC TTTGG ATCTGGC TGGCCCTCTC C ACAG AA 
AGAAAGTAGTACTTTTACTACAATTCTGACGAAACCTAGACCGACCGGGAGAGGTGTCTT 
SF IMKMMLRLLWIWLAL STE> 

730 740 750 760 770 780 

CATTCTC AGTAC AAGG AC TGGTGGTGGAAAGT AC AG ATTGG AAAATGTT AC TAC AGGTTG 
GTAAGAGTCATGTTCCTGACCACCACCTTTCATGTCTAACCTTTTACAATGATGTCCAAC 
HSQYKDWWWKVQIGKCYYRL> 

790 800 810 820 830 840 

GGAATGTATCGTGAAGCAGAAAAACAGTTTAAATCAGCCCTGAAGCAGCAGGAAATGGTA 
CCTTACATAGCACTTCGTCTTTTTGTCAAATTTAGTCGGGACTTCGTCGTCCTTTACCAT 
GMYREAEKQFKSALKQQEMV> 

850 860 870 880 890 900 

GATACATTTCTGTACTTGGCAAAAGTTTATGTCTCATTGGATCAACCTGTGACTGCTTTA 
CTATGTAAAGACATGAACCGTTTTCAAATACAGAGTAACCTAGTTGGACACTGACGAAAT 
DTFLYLAKVYVSLDQPVTAL> 

910 920 930 940 950 960 

AATCTTTTCAAACAAGGCTTAGATAAGTTTCCAGGAGAAGTAACCCTGCTCTGTGGAATT 
TTAGAAAAGTTTGTTCCGAATCTATTCAAAGGTCCTCTTCATTGGGACGAGACACCTTAA 
NLFKQGLDKFPGEVTLLCGI> 

970 980 990 1000 1010 1020 

GCAAGAATCTATGAGGAAATGAACAATATGTCATCAGCAGCAGAATATTACAAAGAAGTT 
CGTTCTTAGATACTCCTTTACTTGTTATACAGTAGTCGTCGTCTTATAATGTTTCTTCAA 
ARIYEEMNNMSSAAEYYKE V> 

1030 1040 1050 1060 1070 1080 

TTGAAACAAGACAATACTCATGTGGRAGCCATCGCATGCATTGGAAGCAACCACTTCTAT 
AACTTTGTTCTGTTATGAGTACACCYTCGGTAGCGTACGTAACCTTCGTTGGTGAAGATA 
LKQDNTHVXAIACIGSNHF Y> 

1090 1100 1110 1120 1130 1140. 

TCTGATCAGCCAGAAATAGCTCTCCGGTTTTACAGGCGGCTGCTGCAGATGGGCATTTAT 
AGACTAGTCGGTCTTTATCGAGAGGCCAAAATGTCCGCCGACGACGTCTACCCGTAAATA 
SDQPEIALRFYRRLLQMGIY> 

1150 1160 1170 1180 1190 1200 

AACGGCCAGCTTTTTAACAATCTGGGGCTGTGTTGCTTCTATGCCCAGCAGTATGATATG 
TTGCCGGTCGAAAAATTGTTAGACCCCGACACAACGAAGATACGGGTCGTCATACTATAC 
NGQLFNNLGLCCFYA QQYDM> 

1210 1220 1230 1240 1250 1260 

ACTCTGACCTCATTTGAACGTGCCCTTTCTTTGGCTGAAAATGAAGAAGAGGCAGCTGAT 
TGAGACTGGAGTAAACTTGCACGGGAAAGAAACCGACTTTTACTTCTTCTCCGTCGACTA 
TLTSFERALSLAENEEEAAD> 
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1270 1280 1290 1300 1310 1320 

GTCTGGTACAACTTGGGACATGTAGCTGTGGGAATAGGAGATACAAATTTGGCCCATCAG 
CAGACCATGTTGAACCCTGTACATCGACACCCTTATCCTCTATGTTTAAACCGGGTAGTC 
VWYNLGHVAVGIGDTNLAHQ> 

1330 1340 1350 1360 1370 1380 

TGCTTCAGGCTGGCTCTGGTCAACAACAACAACCACGCCGAGGCCTACAACAACCTGGCT 
ACGAAGTCCGACCGAGACCAGTTGTTGTTGTTGGTGCGGCTCCGGATGTTGTTGGACCGA 
CFRLALVNNNNHAEAYNNLA> 

1390 1400 1410 1420 1430 1440 

GTGCTGGAGATGCGGAAGGGCCACGTTGAACAGGCAAGGGCACTATTACAAACTGCATCA 
CACGACCTCTACGCCTTCCCGGTGCAACTTGTCCGTTCCCGTGATAATGTTTGACGTAGT 
VLEMRKGH.VEQARALLQTAS> 

1450 1460 1470 1480 1490 1500 

TCATTAGCACCCCATATGTATGAACCGCATTTTAATTTTGCAACAATCTCTGATAAGATT 
AGTAATCGTGGGGTATACATACTTGGCGTAAAATTAAAACGTTGTTAGAGACTATTCTAA 
SLAPHMYEPHFNFATISDKI> 

1510 1520 1530 1540 1550 1560 

GGAGATCTGCAGAGAAGCTATGTTGCTGCGCAGAAGTCTGAAGCAGCATTTCCAGACCAT 
CCTCTAGACGTCTCTTCGATACAACGACGCGTCTTCAGACTTCGTCGTAAAGGTCTGGTA 
GDLQR SYVAAQKSEAAF PDH> 

1570 1580 1590 1600 1610 1620 

GTGGACACACAACATTTAATTAAACAATTAAGGCAGCATTTTGCTATGCTCTGATTGTTC 
CACCTGTGTGTTGTAAATTAATTTGTTAATTCCGTCGTAAAACGATACGAGACTAACAAG 
VDTQHLIKQLRQHFAML> 

1630 1640 1650 1660 1670 1680 

CTTAGACCACATATGTTCTTATGAAGCAGCATTATGCAAGGGGAAAAAAGCACTATGTCT 
GAATCTGGTGTATACAAGAATACTTCGTCGTAATACGTTCCCCTTTTTTCGTGATACAGA 

1690 1700 1710 1720 1730 1740 

GTGTATGTATGTATATAGTGTAATACGTATATTTTAACAAACCTGTCCTTGATATTAGTT 
CACATACATACATATATCACATTATGCATATAAAATTGTTTGGACAGGAACTATAATCAA 

1750 1760 1770 1780 1790 1800 

AAGGTGACACATAAGGGTGACACAGAATGTGTAATGCAAATTTCATAGTAATAGTAACTT 
TTCC AC TGTGT ATTC CC ACTGTGTC TT AC AC ATT ACGTTT AAAGT ATC ATT ATC ATTG AA 

1810 1820 1830 1840 1850 1860 

TATAAAATAATATTATAAAATACAGGATTTAAACCTTTCTAAATAGATCCTGAAACTGTC 
ATATTTTATTATAATATTTTATGTCCTAAATTTGGAAAGATTTATCTAGGACTTTGACAG 

1870 1880 1890 1900 1910 1920 

TCTCACATTATATAGTAGATGTTTGTTTATAATGTTTACAAAACATTTTGGTGAATTTCC 
AGAGTGTAATATATCATCTACAAACAAATATTACAAATGTTTTGTAAAACCACTTAAAGG 

1930 1940 1950 1960 1970 1980 

TCAATGTTTTATAAATGTACATTTTTTAAGTCCTTAAGCTGACTCTTAGCCATCATGTAG 
AGTTACAAAATATTTACATGTAAAAAATTCAGGAATTCGACTGAGAATCGGTAGTACATC 
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1990 2000 2010 2020 2030 2040 

CTTAAGGAGTCTGAAATCTGCCATTAAAACTGCACCTTTAAGCCAGGTGTGGTAGCATGT 
GAATTCCTCAGACTTTAGACGGTAATTTTGACGTGGAAATTCGGTCCACACCATCGTACA 

2050 2060 2070 2080 2090 2100 

GCCTATAGTCCCAGCTACTTGGGAGGTGGAGGTGGGAGGATTATAAATAGAGACTTTCCT 
CGGATATCAGGGTCGATGAACCCTCCACCTCCACCCTCCTAATATTTATCTCTGAAAGGA 

2110 2120 2130 2140 2150 2160 

TAAGACTTTAAAAATGTATTTAAAACTATTTTTTATTAAATACTTTGTGATTTCCTATTA 
ATTCTGAAATTTTTACATAAATTTTGATAAAAAATAATTTATGAAACACTAAAGGATAAT 

2170 2180 2190 2200 2210 

AGCTTTAAAATAAATCATTGTGTAAAACACCATCAAAGCGATAAGCTCTGTAA 
TCG AAATTTT ATTT AGT AAC AC ATTTTGTGGT AGTTTC GC TATTCG AG ACATT 
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Sequence Range: 1 to 4433 



10 , 20 30 40 50 60 

ATAGGAGTGGAGAACATGCACAATTACTGCTTTGTGTTTGCTCTGGGATACCTCACAGTG 
TATCCTCACCTCTTGTACGTGTTAATGACGAAACACAAACGAGACCCTATGGAGTGTCAC 
IGVENMHNYCFVFALGYLT V> 

70 80 90 100 110 120 

TGCCAAGTTACTCGAGTCTATATCTTTGACTATGGACAATATTCTGCTGATTTTTCAGGC 
ACGGTTCAATGAGCTCAGATATAGAAACTGATACCTGTTATAAGACGACTAAAAAGTCCG 
CQVTRVYIFDYGQYSADFS. G> 

130 140 150 160 170 180 

CCAATGATGATCATTACTCAGAAGATCACTAGTTTGGCTTGCGAAATACATGATGGGATG 
GGTTACTACTAGTAATGAGTCTTCTAGTGATCAAACCGAACGCTTTATGTACTACCCTAC 
PMMI ITQKITSLACEIHDG M> 

190 200 210 220 230 240 

TTTCGGAAGGATGAAGAACTGACTTCCTCACAGAGGGATTTAGCTGTAAGGCGCATGCCA 
AAAGCCTTCCTACTTCTTGACTGAAGGAGTGTCTCCCTAAATCGACATTCCGCGTACGGT 
FRKDEELTS SQRDLAVRRMP> 

250 260 270 280 290 300 

AGCTTACTGGAGTATTTGAGTTACAACTGTAACTTCATGGGGATCCTGGCAGGCCCACTT 
TCGAATGACCTCATAAACTCAATGTTGACATTGAAGTACCCCTAGGACCGTCCGGGTGAA 
SLLEY'LSYNCNFMGILAGPL> 

310 320 330 340 350 360 

TGCTCTTACAAAGACTACATTACTTTCATTGAAGGCAGATCATACCATATCACACAATCT 
ACGAGAATGTTTCTGATGTAATGAAAGTAACTTCCGTCTAGTATGGTATAGTGTGTTAGA 
CSYKDYITFIEGRSYHITQS> 

370 380 390 400 410 420 

GGTGAAAATGGAAAAGAAGAGACACAGTATGAAAGAACAGAGCCATCTCCAAATGTAAGG 
CCACTTTTACCTTTTCTTCTCTGTGTCATACTTTCTTGTCTCGGTAGAGGTTTACATTCC 
GENGKEETQYERTEPS PNVR> 

430 440 450 460 470 480 

TCATGAGATTTATCTGGAGCCTTTACAGCATGTATTGACTGCGGKTGTTCAGAAGCTCTT 
AGTACTCTAAATAGACCTCGGAAATGTCGTACATAACTGACGCCMACAAGTCTTCGAGAA 

S> 

490 500 510 520 530 540 

AGTTTGTGGGCTGTCCTTGTTATTTCACTTGACCATCTGTACAACATTACCTGTGGAGTA 
TCAAACACCCGACAGGAACAATAAAGTGAACTGGTAGACATGTTGTAATGGACACCTCAT 

550 560 570 580 590 600 

CAACATTGATGAGCATTTTCAAGCTACAGCTTCGTGGCCAACAAAGATTATCTATCTGTA 
GTTGTAACTACTCGTAAAAGTTCGATGTCGAAGCACCGGTTGTTTCTAATAGATAGACAT 



FIG. 4A 



610 620 630 640 650 660 

TATCTCTCTTTTGGCTGCCAGACCCAAATACTATTTTGCATGGACGCTAGCTGACTGCCA 
ATAGAGAGAAAACCGACGGTCTGGGTTTATGATAAAACGTACCTGCGATCGACTGACGGT 

670 680 690 700 710 720 

TWAATAATGCTGCAGGCTTTGGTTTCAGAGGGTATGACGAAAATGGAGCAGCTCGCTGGG 
AWTTATTACGACGTCCGAAACCAAAGTCTCCCATACTGCTTTTACCTCGTCGAGCGACCC 

730 740 750 760 770 780 

ACTTAATTTCCAATTTGAGAATTCAACAAATAGAGATGTCAACAAGTTTCAAGATGTTTC 
TGAATTAAAGGTTAAACTCTTAAGTTGTTTATCTCTACAGTTGTTCAAAGTTCTACAAAG 

790 800 810 820 830 840 

TTGATAATTGG AAT ATTC AGACAGC TCTTTGGCTC AAAAGGTGCGTTC CTTC AAAAAC G A 
AACTATTAACCTTATAAGTCTGTCGAGAAACCGAGTTTTCCACGCAAGGAAGTTTTTGCT 

850 860 870 880 890 900 

TCTTTAGATGTGCTTTGGCGTCTAGTTCTCGAGGTTGAGCTTCATTGAGTTCAGGTTCTT 
AGAAATCTACACGAAACCGCAGATCAAGAGCTCCAACTCGAAGTAACTCAAGTCCAAGAA 

910 920 930 940 950 960 

GATTAAATTAACGGTGTTGAGTGACATTGTGACCTCAGTGTCAGCCGGGAAACACTGTTA 
CTAATTTAATTGCCACAACTCACTGTAACACTGGAGTCACAGTCGGCCCTTTGTGACAAT 

970 980 990 1000 1010 1020 

GCCTCCTCCTAAGCAAGTCAGTATCGAATGAGAACTATTTTGGCTTGAGTCACGAATGCA 
CGGAGGAGGATTCGTTCAGTCATAGCTTACTCTTGATAAAACCGAACTCAGTGCTTACGT 

1030 1040 1050 1060 1070 1080 

GCTATCCTGCAGGTGCAGCTATCCTGCCCTCTCAAGCCTCCTTTAAAGGCCTCTGCCAAT 
CGATAGGACGTCCACGTCGATAGGACGGGAGAGTTCGGAGGAAATTTCCGGAGACGGTTA 

1090 1100 1110 1120 1130 1140 

GTCAGAGGTCACCAGTATCCTCCTTTGCAGCTCCTGATTGTGTTCAGTAGAGATGTGGTT 
CAGTCTCCAGTGGTCATAGGAGGAAACGTCGAGGACTAACACAAGTCATCTCTACACCAA 

1150 1160 1170 1180 1190 1200 

TAAATTAACAAGTGCCTGCACAAGCACAGTACTTATGCCTGGGTACTCCAGAACAGTCCT 
ATTTAATTGTTCACGGACGTGTTCGTGTCATGAATACGGACCCATGAGGTCTTGTCAGGA 

1210 1220 1230 1240 1250 1260 

GGTTTTAAATATTTCAATTCAACAAATCTTKATTTGTTAGGCAAGGGAAACAAACATGAG 
CCAAAATTTATAAAGTTAAGTTGTTTAGAAMTAAACAATCCGTTCCCTTTGTTTGTACTC 

1270 1280 1290 1300 1310 1320 

TAAGATAAAAAGACTCAGCTCCTGAAAGTGAAAGAGTTCACAATTTTATTAAAGACACGG 
ATTCTATTTTTCTGAGTCGAGGACTTTCACTTTCTCAAGTGTTAAAATAATTTCTGTGCC 

1330 1340 1350 1360 1370 1380 

TGGTGTAATCAGACACATGCTGTTCCCTGTGGTGAGGATGAGGAGAGAGAAAGCAGGAAC 
ACCACATTAGTCTGTGTACGACAAGGGACACCACTCCTACTCCTCTCTCTTTCGTCCTTG 



FIG. 4B 



1390 1400 1410 1420 1430 1440 

AGCGAGGGCACAGAGGGATGCGGGAAGAACTTCCTACAAGTGTGGGTGCTTGAGCTGAGG 
TCGCTCCCGTGTCTCCCTACGCCCTTCTTGAAGGATGTTCACACCCACGAACTCGACTCC 

1450 1460 1470 1480 1490 1500 

TTTGTGTCAGGAGCGTGTCTCGTGAACAGGGCAAGGTAGAGGCAAGCCAGGCTGGGTGGA 
AAACACAGTCCTCGCACAGAGCACTTGTCCCGTTCCATCTCCGTTCGGTCCGACCCACCT 

1510 1520 1530 1540 1550 1560 

GTAACAGGTGCGAAGGACAGAGCTGGGGAACAGCACACTCTCCCAGGGGTTCTCTTATCG 
CATTGTCCACGCTTCCTGTCTCGACCCCTTGTCGTGTGAGAGGGTCCCCAAGAGAATAGC 

1570 1580 1590 1600 1610 1620 

TCCCTGTGAGCACATTGCCCTATCTTGAATTTACTTCATAAAAAACGGCCCCTATAACGA 
AGGGACACTCGTGTAACGGGATAGAACTTAAATGAAGTATTTTTTGCCGGGGATATTGCT 

1630 1640 1650 1660 1670 1680 

TACGGTGATAAGCAGCCTTTTTTTATAGTGTCCTTTTTTAAATGACAAATTAAACATCTT 
ATGCCACTATTCGTCGGAAAAAAATATCACAGGAAAAAATTTACTGTTTAATTTGTAGAA 

1690 1700 1710 1720 1730 1740 

TATCCCTTGAGATGGCTAGCATACGCTGTCATCTCTTCACAGTGCCTGGCAGTCTCCCCA 
ATAGGGAACTCTACCGATCGTATGCGACAGTAGAGAAGTGTCACGGACCGTCAGAGGGGT 

1750 1760 1770 1780 1790 1800 

GTGGCTGCAGATCCTCTGAGCTAATCTGTTGTGTTATTTTTTGTTATTGTTATAATTTAA 
CACCGACGTCTAGGAGACTCGATTAGACAACACAATAAAAAACAATAACAATATTAAATT 

1810 1820 1830 1840 1850 I860 

ATTTGATACCTTAGGGGAAACTTTATTTTCAGCTGAGTTCTCTATCCCTGTCATAGAAGA 
TAAACTATGGAATCCCCTTTGAAATAAAAGTCGACTCAAGAGATAGGGACAGTATCTTCT 

1870 1880 1890 1900 1910 1920 

ATTGTAGACTAAGCACAGTCTATCTGCCGGAAGGAGTAGTGTTATTAGGTCAGTTGAAAG 
TAACATCTGATTCGTGTCAGATAGACGGCCTTCCTCATCACAATAATCCAGTCAACTTTC 

1930 1940 1950 I960 1970 1980 

TTATTGATTTTTTTTAAATAAAATAATGTAGGATAAAAGCAACCTTACTCTTTTTGTAAA 
AATAACTAAAAAAAATTTATTTTATTACATCCTATTTTCGTTGGAATGAGAAAAACATTT 

1990 2000 2010 2020 2030 2040 

TTGTATAGACTCCCAAATACTAGAAATGATCATTTAAGTTACTATATATACCAATATATA 
AACATATCTGAGGGTTTATGATCTTTACTAGTAAATTCAATGATATATATGGTTATATAT 

2050 2060 2070 2080 2090 2100 

TACTATATATACCAATAAGAAGATGAGAATTAACTTTATGTTCCTAAATTTGACACTTAA 
ATGATATATATGGTTATTCTTCTACTCTTAATTGAAATACAAGGATTTAAACTGTGAATT 

2110 2120 2130 2140 2150 2160 

T AGCT ATAGC C TCCCTGAG ATC AT AG AG AAGTG ATTGCC T AAG ATAAGTTGT ATTTGTTT 
ATCGATATCGGAGGGACTCTAGTATCTCTTCACTAACGGATTCTATTCAACATAAACAAA 



FIG. 4C 



2170 2180 2190 2200 2210 2220 

TTCTAGTTACCCTAAATCCTGTCAGGTAATAAAAGAATGATCATTGCAGGCTTTGTAAAC 
AAGATCAATGGGATTTAGGACAGTCCATTATTTTCTTACTAGTAACGTCCGAAACATTTG 

2230 2240 2250 2260 2270 2280 

TCGGGTCACTCACTCCACTTGGCTCTCCATGTTTTTCATGGTTTCTAGGGTGTGTTATGA 
AGCCCAGTGAGTGAGGTGAACCGAGAGGTACAAAAAGTACCAAAGATCCCACACAATACT 

2290 2300 2310 2320 2330 2340 

ACGAACCTCCTTCAGTCCAACTATCCAGACGTTCATTCTCTCTGCCATTTGGCACGGGGT 
TGCTTGGAGGAAGTCAGGTTGATAGGTCTGCAAGTAAGAGAGACGGTAAACCGTGCCCCA 

2350 2360 2370 2380 2390 2400 

ATACCCAGGATATTATCTAACGTTTCTAACAGGGGTGTTAATGACATTAGCAGCAAGAGC 
TATGGGTCCTATAATAGATTGCAAAGATTGTCCCCACAATTACTGTAATCGTCGTTCTCG 

2410 2420 2430 2440 2450 2460 

TGTAAGTATCAAGAATTTTATTTTACAATTCAATGGTCCACTTGAACTGTTAAAAAGGCT 
ACATTCATAGTTCTTAAAATAAAATGTTAAGTTACCAGGTGAACTTGACAATTTTTCCGA 

2470 2480 2490 2500 2510 2520 

GAGTACATCTCTCTTACAAGGTAGACCCTCTTTCCTTGGTCGTGGTCAGTATTGTCCTTT 
CTCATGTAGAGAGAATGTTCCATCTGGGAGAAAGGAACCAGCACCAGTCATAACAGGAAA 

2530 2540 2550 2560 2570 2580 

CCACTAGAAGCGAGGTGTGTACTGCGTGCATGTTTGCTGAGCGCTCACCACGGGCTAGGC 
GGTGATCTTCGCTCCACACATGACGCACGTACAAACGACTCGCGAGTGGTGCCCGATCCG 

2590 2600 2610 2620 2630 2640 

TCCATGCCCAGTTCCTGTGAGGAGAAAACACGTTTCTATGTGCCCGGCAGGTAGGAGGCA 
AGGTACGGGTCAAGGACACTCCTCTTTTGTGCAAAGATACACGGGCCGTCCATCCTCCGT 

2650 2660 2670 2680 2690 2700 

CTCACAAAATGTTACTTTGTCTTTACAGAATTTTCTGAAGGAGAGATAAAAACTGAGTTA 
GAGTGTTTTACAATGAAACAGAAATGTCTTAAAAGACTTCCTCTCTATTTTTGACTCAAT 

2710 2720 2730 2740 2750 2760 

AATAAAGATGATCAGAATGGATGAGAAATAACTTTAGACATTATTTCATTGAACCTTCCC 
TTATTTCTACTAGTCTTACCTACTCTTTATTGAAATCTGTAATAAAGTAACTTGGAAGGG 

2770 2780 2790 2800 2810 2820 

AACTGAAATTATTTTATGATGTTATAACATGGATAGTAACTCAAGTAGCAATAAGTTACA 
TTG AC TTTAATAAAAT ACTAC AAT ATTGT AC C T ATC ATTG AGTTC ATCGTTATTC AATGT 

2830 2840 2850 2860 2870 2880 

CAGTTGTGCCATTTGTGCTTCTTTCTATAAAACCATCACTCACGTTTTACAGCTCCTGGT 
GTCAACACGGTAAACACGAAGAAAGATATTTTGGTAGTGAGTGCAAAATGTCGAGGACCA 

2890 2900 2910 2920 2930 2940 

ATTATTGCCTGCACATTCTTGGTATCTTAGTATTATTGTTGTTGCCAGTGAAAAAAACTC 
TAATAACGGACGTGTAAGAACCATAGAATCATAATAACAACAACGGTCACTTTTTTTGAG 
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2950 2960 2970 2980 2990 3000 

AAAGAAGAAAGAATACACATGAAAACATTCAGCTCTCACAATCCAAAAAGTTTGATGAAG 
TTTCTTCTTTCTTATGTGTACTTTTGTAAGTCGAGAGTGTTAGGTTTTTCAAACTACTTC 

3010 3020 3030 3040 3050 3060 

GAGAAAATTCTTTGGGACAGAACAGTTTTTCTACAACAAACAATGTTTGCAATCAGAATC 
CTCTTTTAAGAAACCCTGTCTTGTCAAAAAGATGTTGTTTGTTACAAACGTTAGTCTTAG 

3070 3080 3090 3100 3110 3120 

AAGAAATAGCCTCGAGACATTCATCACTAAAGCAGTGATCGGGAAGGCTCTGAGGGCTGT 
TTCTTTATCGGAGCTCTGTAAGTAGTGATTTCGTCACTAGCCCTTCCGAGACTCCCGACA 

3130 3140 3150 3160 3170 3180 

TTTTTTTTTTTGATGTTAACAGAAACCAATCTTAGCACCTTTTCAAGGGGTTTGAGTTTG 
AAAAAAAAAAACTACAATTGTCTTTGGTTAGAATCGTGGAAAAGTTCCCCAAACTCAAAC 

3190 3200 3210 3220 3230 3240 

TTGGAAAAGCAGTTAACTGGGGGGAAATGGACAGTTATAGATAAGGAATTTCCTGTACAC 
AACCTTTTCGTCAATTGACCCCCCTTTACCTGTCAATATCTATTCCTTAAAGGACATGTG 

3250 3260 3270 3280 3290 3300 

CAGATTGGAAATGGAGTGAAACAAGCCCTCCCATGCCATGTCCCCGTGGGCCACGCCTTA 
GTCTAACCTTTACCTCACTTTGTTCGGGAGGGTACGGTACAGGGGCACCCGGTGCGGAAT 

3310 3320 3330 3340 3350 3360 

TGTAAGAATATTTCCATATTTCAGTGGGCACTCCCAACCTCAGCACTTGTCCGTAGGGTC 
ACATTCTTATAAAGGTATAAAGTCACCCGTGAGGGTTGGAGTCGTGAACAGGCATCCCAG 

3370 3380 3390 3400 3410 3420 

ACACGCGTGCCCTGTTGCTGAATGTATGTTGCGTATCCCAAGGCACTGAAGAGGTGGAAA 
TGTGCGCACGGGACAACGACTTACATACAACGCATAGGGTTCCGTGACTTCTCCACCTTT 

3430 3440 3450 3460 3470 3480 

AATAATCGTGTCAATCTGGATGATAGAGAGAAATTAACTTTTCCAAATGAATGTCTTGCC 
TTATTAGCACAGTTAGACCTACTATCTCTCTTTAATTGAAAAGGTTTACTTACAGAACGG 

3490 3500 3510 3520 3530 v 3540 

TTAAACCCTCTATTTCCTAAAATATTGTTCCTAAATGGTATTTTCAAGTGTAATATTGTG 
AATTTGGGAGATAAAGGATTTTATAACAAGGATTTACCATAAAAGTTCACATTATAACAC 

3550 3560 3570 3580 3590 3600 

AGAACGCTACTGCAGTAGTTGATGTTGTGTGCTGTAAAGGATTTTAGGAGGAATTTGAAA 
TCTTGCGATGACGTCATCAACTACAACACACGACATTTCCTAAAATCCTCCTTAAACTTT 

3610 3620 3630 3640 3650 3660 

CAGGATATTTAAGAGTGTGGATATTTTTAAAATGCAATAAACATCTCAGTATTTGAAGGG 
GTCCTATAAATTCTCACACCTATAAAAATTTTACGTTATTTGTAGAGTCATAAACTTCCC 

3670 3680 3690 3700 3710 3720 

TTTTCTTAAAGTATGTCAAATGACTACAATCCATAGTGAAACTGTAAACAGTAATGGACG 
AAAAGAATTTCATACAGTTTACTGATGTTAGGTATCACTTTGACATTTGTCATTACCTGC 
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3730 3740 3750 3760 3770 3780 

CCAAATTATAGGTAGCTGATTTTGCTGGAGAGTTTAATTACCTTGTGCAGTCAAAGAGCG 
GGTTTAATATCCATCGACTAAAACGACCTCTCAAATTAATGGAACACGTCAGTTTCTCGC 

3790 3800 3810 3820 3830 3840 

CTTCCAGAAGGAATCTCTTAAAACATAATGAGAGGTTTGGTAATGTGATATTTTAAGCTT 
GAAGGTCTTCCTTAGAGAATTTTGTATTACTCTCCAAACCATTACACTATAAAATTCGAA 

3850 3860 3870 3880 3890 3900 

ATTCTTTTTCTTAAAAGAGAGAGGTGACGAAGGAAGGCAGGAATGAAGAAGCACTGCGTG 
TAAGAAAAAGAATTTTCTCTCTCCACTGCTTCCTTCCGTCCTTACTTCTTCGTGACGCAC 

3910 3920 3930 3940 3950 3960 

GCCTCCGGTGGAATGCACGGGGCACAGCCGCGACTCTGCAGGCAGCTTCCCCCCCATGCC 
CGGAGGCCACCTTACGTGCCCCGTGTCGGCGCTGAGACGTCCGTCGAAGGGGGGGTACGG 

3970 3980 3990 4000 4010 4020 

CAGGGCTCTGCGCCGTCATGTGAGACTTAAAAAAAAAGTTGAATGACTTCGTGATACTTT 
GTCCCGAGACGCGGCAGTACACTCTGAATTTTTTTTTCAACTTACTGAAGCACTATGAAA 

4030 4040 4050 4060 4070 4080 

GGACTTCTAAATTAAATTTATCAGGCATAAATTATGTAGAATTAGAGGCTTTGAAAATAA 
CCTGAAGATTTAATTTAAATAGTCCGTATTTAATACATCTTAATCTCCGAAACTTTTATT 

4090 4100 4110 4120 4130 4140 

TACTGGTAGGTTGCTCAAAGGTTTTGAAAGAGAAATCGCTAGGTAGGTTACTATCTGGCT 
ATGACCATCCAACGAGTTTCCAAAACTTTCTCTTTAGCGATCCATCCAATGATAGACCGA 

4150 4160 4170 4180 4190 4200 

AATCCATTTCTTATCCTTGACAATTTAATTCATATTTGGGAAACTTTTAGGGAAATGAAA 
TTAGGTAAAG AAT AGGAAC TGTT AAATTAAGT AT AAACCCTTTG AAAATCC C TTTAC TTT 

4210 4220 4230 4240 4250 4260 

AATAAAAGTCACTGAGTCTGGGTGACATTTTTTAAGAATAATATAAATTCAGTTTCAAAC 
TTATTTTCAGTGACTCAGACCCACTGTAAAAAATTCTTATTATATTTAAGTCAAAGTTTG 

4270 4280 4290 4300 4310 4320 

TCTTCTCACATTAAAATTTTGCTGTGAACTCTTACTAAAATGAGTTTTAGGTTCTGTAAG 
AGAAGAGTGTAATTTTAAAACGACACTTGAGAATGATTTTACTCAAAATCCAAGACATTC 

4330 4340 4350 4360 4370 4380 

TGGAAAAATGTGCTTTTATTTTATGGGCCATTTTTACCACAACTAATCTTGCCTTGGATT 
ACCTTTTTACACGAAAATAAAATACCCGGTAAAAATGGTGTTGATTAGAACGGAACCTAA 

4390 4400 4410 4420 4430 

ACTAAGCATCTCCTGCGATCCCACAGAGGACTGTGGTGGCCACAGGAGCTGAA 
TGATTCGTAGAGGACGCTAGGGTGTCTCCTGACACCACCGGTGTCCTCGACTT 
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Sequence Range: 1 to 1276 



10 20 30 40 50 60 

ATAGGAGTGGAGAACATGCACAATTACTGCTTTGTGTTTGCTCTGGGATACCTCACAGTG 
TATCCTCACCTCTTGTACGTGTTAATGACGAAACACAAACGAGACCCTATGGAGTGTCAC 
IGVENMHNYCFVFALGYLT V> 

70 80 90 100 110 120 

TGCCAAGTTACTCGAGTCTATATCTTTGACTATGGACAATATTCTGCTGATTTTTCAGGC 
ACGGTTCAATGAGCTCAGATATAGAAACTGATACCTGTTATAAGACGACTAAAAAGTCCG 
CQVTRVYIFDYGQYSADFSG> 

130 140 150 160 170 180 

CCAATGATGATCATTACTCAGAAGATCACTAGTTTGGCTTGCGAAATACATGATGGGATG 
GGTTACTACTAGTAATGAGTCTTCTAGTGATCAAACCGAACGCTTTATGTACTACCCTAC 
PMMI ITQKITSLACEIHDG M> 

190 200 210 220 230 240 

TTTC GG AAGG ATG AAG AAC TG ACTTC C TC AC AG AGGGATTT AGC TGT AAGGCGC ATGCC A 
AAAGC CTTCCT AC TTCTTG AC TG AAGG AGTGTCTC C CT AAATCG AC ATTCCGC GT ACGGT 
FRKDEELTSSQRDLAVRRMP> 

250 260 270 280 290 300 

AGCTTACTGGAGTATTTGAGTTACAACTGTAACTTCATGGGGATCCTGGCAGGCCCACTT 
TCGAATGACCTCATAAACTCAATGTTGACATTGAAGTACCCCTAGGACCGTCCGGGTGAA 
SLLEYLSYNCNFMGILAGP L> 

310 320 330 340 350 360 

TGCTCTTACAAAGACTACATTACTTTCATTGAAGGCAGATCATACCATATCACACAATCT 
ACGAGAATGTTTCTGATGTAATGAAAGTAACTTCCGTCTAGTATGGTATAGTGTGTTAGA 
CSYKDYITFIEGRSYHITQS> 

370 380 390 400 410 420 

GGTGAAAATGGAAAAGAAGAGACACAGTATGAAAGAACAGNAGCCATCTCCAAATGTAAG 
CCACTTTTACCTTTTCTTCTCTGTGTCATACTTTCTTGTCNTCGGTAGAGGTTTACATTC 
GENGKEETQYERTXA ISK C K> 

430 440 450 460 470 480 

GTCATGAGATTTATCTGGAGCCTTTACAGCATGTATTGNACTGCGGKTGTTCAGAAGCTC 
CAGTACTCTAAATAGACCTCGGAAATGTCGTACATAACNTGACGCCMACAAGTCTTCGAG 
VMRFIWSLYSMYXTAXVQKL> 

490 500 510 520 530 540 

TTAGTTTGTGGGCTGTCCTTGTTATTTCACTTGACCATCTGTACAACATTACCTGTGGAG 
AATCAAACACCCGACAGGAACAATAAAGTGAACTGGTAGACATGTTGTAATGGACACCTC 
LVCGLSLLFHLTICTTLPVE> 

550 560 570 580 590 600 

TACAACATTGATGAGCATTTTCAAGCTACAGCTTCGTGGCCAACAAAGATTATCTATCTG 
ATGTTGTAACTACTCGTAAAAGTTCGATGTCGAAGCACCGGTTGTTTCTAATAGATAGAC 
YNIDEHFQATASWPTKIIYL> 

610 620 630 640 650 660 
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TATATCTCTCTTTTGGCTGCCAGACCCAAATACTATTTTGCATGGACGCTAGCTGATGCC 
ATATAGAGAGAAAACCGACGGTCTGGGTTTATGATAAAACGTACCTGCGATCGACTACGG 
YI SLLAARPKYYFAWTLAD A> 

670 680 690 700 710 720 

ATTAATAATGCTGCAGGCTTTGGTTTCAGAGGGTATGACGAAAATGGAGCAGCTCGCTGG 
TAATTATTACGACGTCCGAAACCAAAGTCTCCCATACTGCTTTTACCTCGTCGAGCGACC 
INNAAGFGFRGYDENGAAR W> 

730 740 750 760 770 780 

g ac tt aatttc c aatttg ag aattc aac aaat agag atgtc aac aagtttc aagatgttt 
ctgaattaaaggttaaactcttaagttgtttatctctacagttgttcaaagttctacaaa 
dlisnlri'qqiemst'sfkmf> 

790 800 810 820 830 840 

CTTGATAATTGGAATATTCAGACAGCTCTTTGGCCCAAAAGGGTGTGTTATGAACGAACC 
GAACTATTAACCTTATAAGTCTGTCGAGAAACCGGGTTTTCCCACACAATACTTGCTTGG 
LDNWNI QTALWPKRVCYERT> 

850 860 870 880 890 900 

TCCTTCAGTCCAACTATCCAGACGTTCATTCTCCCTGCCATTNTGGCACGGGGTATACCC 
AGGAAGTCAGGTTGATAGGTCTGCAAGTAAGAGGGACGGTAANACCGTGCCCCATATGGG 
SFSPTIQTFILPAIXARGIP> 

910 920 930 940 950 960 

AGGATATTATCTAACGTTTCTAACAGGGGTGTTAATGACATTAGCAGCAGAGCTATGAGA 
TCC T AT AATAG ATTGC AAAG ATTGTCCCC AC AATTACTGTAATCGTC GTC TCG AT AC TC T 
RI L SNV.SNRGVNDI S S RAM R> 

970 980 990 1000 1010 1020 

AATAACTTTAGACATTATTTCATTGAACCTTCCCAACTGAAATTATTTTATGATGTTMTA 
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GDTWDS SSTSAPKPDTTTGR> 



FIG. 5B 



1270 

GGGGGTGGGGCAACCC 
CCCCCACCCCGTTGGG 
G G G A T 



FIG. 




FIG. 6 



